*********************************************************************************
*** Clean water source data 
*********************************************************************************

#delimit ;  set type double, permanentely ; 
clear ;  clear matrix ; clear mata ; 
set matsize 5000 ;  set maxvar 5000 ;   set more off;   set rmsg on ;  pause on;  

set path here ; 

tempfile f1 f2 f3 ; 

import excel $path\watersource_coordinates.xlsx, sheet("location") firstrow clear ; 

ren 序号           id ;  
ren 省份           province ; 
ren 所属城市       city ;  
ren 水源地名称     name ;  
ren 水源地性质     type ;  
     
gen longitude= 谷歌经度 ; 
gen latitude= 谷歌纬度 ; 

replace longitude=市县经度百度 if longitude==. |longitude==0 ; 
replace latitude=市县纬度百度 if latitude==. |latitude==0 ;   

label var id         "水源地序号" ;                                               
label var province   "水源地省份" ;  
label var city       "水源地所属城市" ;  
label var longitude  "水源地longitude(Google)" ;  
label var latitude   "水源地latitude(Google)" ;  

keep id province city name type longitude latitude ; 
mdesc ; 

save $pathdata\watersource_coordinates.dta, replace ; 
keep id type longitude latitude ; 
gen type_eng= "underground water" ; 
replace type_eng="river" if type=="河流" ; 
replace type_eng="lake" if type=="湖库" ; 
export excel using $path\Watersource_coordinates.xlsx, firstrow(variables) replace ; 


keep type longitude latitude ; 
save $path\watersource_simple, replace ; 



